MTD:用于场景理解的一百万视频数据集 - 知乎

我们提供了Moments in Time Dataset,这是一个大型的人工注释的100万个短视频集,对应于在三秒钟内展开的动态事件。 即使是在3秒视频中发生的动作,对 …

本文介绍了MIT-IBM Watson AI Lab发布的Moments-in-Time数据集,这是一个专注于动作分类的视频理解数据集,拥有百万规模的视频和多样性的 …

A large-scale human-annotated collection of short videos for action recognition and event understanding. The dataset covers 339 …

A large-scale human-annotated collection of short videos for action recognition and event understanding. The dataset covers 339 …

更多内容请点击:MTD:用于场景理解的一百万视频数据集 - 知乎 推荐文章